مدل جدیدی برای جستجوی عبارت بر اساس کمینه جابهجایی وزندار
نویسنده
چکیده مقاله:
Finding high-quality web pages is one of the most important tasks of search engines. The relevance between the documents found and the query searched depends on the user observation and increases the complexity of ranking algorithms. The other issue is that users often explore just the first 10 to 20 results while millions of pages related to a query may exist. So search engines have to use suitable algorithms with high performance to find the most relevant pages. The ranking section is an important part of search engines. Ranking is a process in which the web page quality is estimated by the search engine. There are two main methods for ranking web pages. In the first method, ranking is done based on the documents’ content (traditional rankings). Models, such as Boolean model, probability model and vector space model are used to rank documents based on their contents. In the second method, based on the graph, web connections and the importance of web pages, ranking process is performed. Based on researches on search engines, the majority of user queries is more than one term. For queries with more than one term, two models can be used. The first model assumes that query terms are independent of each other while the second model considers a location and order dependency between query terms. Experiments show that in the majority of queries there are dependencies between terms. One of the parameters that can specify dependencies between query terms is the distance between query terms in the document. In this paper, a new definition of distance based on Minimum Weighted Displacement Model (MWDM) of document terms to accommodate the query terms is presented. In the Minimum Weighted Displacement Model (MWDM), we call the minimum number of words moving a text to match the query term by space. In addition, because most of the ranking algorithms use the TF (Term Frequency) to score documents and for queries more than one term, there is no clear definition of these parameters; in this paper, according to the new distance concept, Phrase Frequency and Inverted Document Frequency are defined. Also, algorithms to calculate them are presented. The results of the proposed algorithm compared with multiple corresponding algorithms shows a favorable increase in average precision.
منابع مشابه
بررسی میزان استفاده از اینترنت برای جستجوی اطلاعات سلامت در میان زنان بر اساس مدل پذیرش فناوری (TAM)
چکیده: زمینه و هدف: امروزه اینترنت به یکی از منابع مهم برای جستجوی اطلاعات سلامت تبدیل شده است که یکی از مهمترین گروههای استفاده کننده از آن برای جستجوی اطلاعات سلامت را زنان تشکیل میدهند. مواد و روشها: مطالعه حاضر یک پژوهش کمی از نوع توصیفی- تحلیلی است و استفاده از اینترنت برای جستجوی اطلاعات سلامت در میان زنان را با استفاده از مدل پذیرش فناوری مورد ارزیابی قرار داده است. ابزار مورد استفاده ...
متن کاملامدادرسانی زمانمند بر اساس جستجوی فراکتال
پس از وقوع بحران، آمادگی برایامدادرسانی کارآمدنقشی اساسی در کاهش هزینهها و تلفات انسانی احتمالی حادثه خواهد داشت. امدادرسانی بهعنوان یکی از مهمترین مراحل توسعه سامانههای مدیریت بحران شناخته میشود. به منظور توسعه رویکردی کارا برای امدادرسانی زمانمند، در این پژوهش به حل مسئلهای بر اساس مسئله مسیریابی موجودی با وضعیت چند دورهای و چند کالایی پرداخته شده است. جهت حل مدل، از یک الگوریتم بهبود...
متن کاملزیرگونه جدیدی از سنجد تلخ (Elaeagnus rhamnoides (L.) A.Nelson) برای ایران بر اساس دادههای مولکولی
سنجد تلخ (Elaeagnus rhamnoides (L.) A.Nelson) گیاهی دارویی، مقاوم به خشکی، تثبیتکننده ازت و یک گونه پیشآهنگ جنگلی است. در این پژوهش برای اولین بار در ایران، شناسایی مولکولی سنجد تلخ در رویشگاههای مختلف کشور و مقایسه آنها با زیرگونههای شناخته شده در سایر نقاط جهان انجام شد. از پنج رویشگاه در استانهای البرز، مازندران، آذربایجانشرقی و غربی و قزوین نمونهبرداری انجام گردید. از نشانگر هستها...
متن کاملتعیین شاخص سوز باد استان اصفهان بر اساس دمای کمینه
آب و هوا تاثیر بسیار مهمی در حیات موجودات زنده کره زمین دارد. وزش باد با دما اثر تلفیقی احساس محیط را ایجاد مینماید، بطوریکه به کاهش دما همراه با باد، سوزباد و برعکس آن گرم باد اطلاق میشود. در این تحقیق سوزباد دمای کمینه در استان اصفهان مورد بررسی قرار گرفت. دمای کمینه و سرعت وزش باد برای 10 ایستگاه همدیدی استان طی دوره آماری 1372 تا 1394 از سازمان هواشناسی کشور تهیه گردید. نتایج نشان داد...
متن کاملرشد درونزا: یک مدل جستجوی تصادفی برای فن آوری جدید
این مقاله رشد درونزا، بر پویایی مدلی در انباشت دانش تاکید دارد. با توجه به نا اطمینانی موجود در هر فرایند جستجو، مدل یک ساختار پویای تصادفی که در آن فن آوری و انباشت دانش مکمل همدیگر می باشند ارائه میکند که هر یک از دو موتور رشد انباشت سرمایه و فن آوری تا یک نقطه مکمل همدیگر می باشند و بعد از آن تاثیر هریک مقید به سطح دیگری است. نشان داده میشود که هر دو عامل انباشت سرمایه و پیشرفت فن آوری برا...
متن کاملاصلاح مدل بیلان حجمی با بهبود عبارت ذخیره سطحی برای آبیاری جویچه ای
راندمان سیستمهای آبیاری سطحی در ایران بسیار پائین است. در صورتیکه بتوان پارامترهای مهم و موثر در طراحیآبیاری سطحی، از قبیل فرصت نفوذ و زمان پیشروی را در ازای یک دبی مشخصبه خوبی برآورد کرد، میتوانراندمان کاربرد این سیستم را به مقدار قابل توجهی افزایش داد. مدل بیلان حجمی یکی از مدلهای ساده و رایج درطراحی و ارزیابی آبیاری جویچهای میباشد. با توجه به فرضیاتی که در مدل بیلان حجمی اعمال میشود دقت این ...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
عنوان ژورنال
دوره 15 شماره 4
صفحات 71- 84
تاریخ انتشار 2019-03
با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.
کلمات کلیدی برای این مقاله ارائه نشده است
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023